组合式创新？CLIP+VQGAN

Original shadow chi 无界社区mixlab 2022-06-06

收录于合集

#Mix群聊 154 个

#Mixlab推荐 61 个

ace

新旧交替之际，不同时代的审美。这个现象真有趣~~

知识库

最近有大量使用CLIP+VQGAN的数字艺术作品出现，这两项组合技术不知大家都玩过没？

OpenAI的CLIP

用于连接文本与图像

具体的应用，比如一位开发者的项目：通过文本搜索精准匹配图片的项目。该项目大约有200 万张Unsplash的图片，通过 CLIP 模型处理后，可以使用自然语言进行精准搜索。

github.com/haltakov/natural-language-image-search

"Two dogs playing in the snow"

"The word love written on the wall"

VQGAN

生成式模型

关键是使用Transformer来把图像encoder后的编码进行了转化，学习到了图像特征的上下文关系

Taming Transformers for High-Resolution Image Synthesis

CVPR 2021

Transformer

从NLP走向CV

Transformer最初应用于NLP任务，是2017年的论文《Attention is All You Need》提出的模型架构，作者实验了机器翻译，获得了当时的SOTA。语言是有很明显的上下文关系的，基于此特点，开始了在CV领域的应用探索。

无界

引用我超喜欢程序猿的一句diss用语：

Talk is cheap ,
show me the code

都是开源的……

那么CLIP+VQGAN是什么？

使用CLIP来代替VQGAN的鉴别器

shadow

eva

我来测试下CLIP+VQGAN ~~

opus

@Bessie 看看~

有那么点味道~~

ibrand

我来试试最近的hack city城市黑客这一主题~~~~

还用上了深度估计+fake 3D来生成GIF

大家可以基于hack city来创作各种数字图像作品~~~哈哈

shadow

opus

在线玩耍地址：

huggingface.co/spaces/akhaliq/VQGAN_CLIP

👨🏼‍🎤👩🏻👨🏻‍💼👤🦸🏻🧑🏻‍🎤

如果对以上话题感兴趣，
欢迎加入社群，

关注后回复：群聊

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

组合式创新？CLIP+VQGAN

OpenAI的CLIP

用于连接文本与图像

具体的应用，比如一位开发者的项目：通过文本搜索精准匹配图片的项目。该项目大约有200 万张Unsplash的图片，通过 CLIP 模型处理后，可以使用自然语言进行精准搜索。

"Two dogs playing in the snow"

"The word love written on the wall"

Taming Transformers for High-Resolution Image Synthesis

CVPR 2021

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突 认定该生系高空坠落死亡

市管干部“龚书记”免职迷局

讣告！又一知名女星在家中去世，终年54岁，曾是无数人白月光…

近视的孩子有救了！国内最新近视防控矫正技术，不手术，扫码进群即可了解！

著名口述史学者Portelli的一部被忽视的口述史作品 | 一个工业小镇的传记：意大利特尔尼（1831-2014）

生成图片，分享到微信朋友圈

组合式创新？CLIP+VQGAN

OpenAI的CLIP

用于连接文本与图像

具体的应用，比如一位开发者的项目：通过文本搜索精准匹配图片的项目。该项目大约有200 万张Unsplash的图片 ，通过 CLIP 模型处理后，可以使用自然语言进行精准搜索。

"Two dogs playing in the snow"

"The word love written on the wall"

Taming Transformers for High-Resolution Image Synthesis

CVPR 2021

您可能也对以下帖子感兴趣

观察｜官方通报陕西蒲城一职校学生坠亡：事发前与舍友发生口角和肢体冲突认定该生系高空坠落死亡

具体的应用，比如一位开发者的项目：通过文本搜索精准匹配图片的项目。该项目大约有200 万张Unsplash的图片，通过 CLIP 模型处理后，可以使用自然语言进行精准搜索。